import pandas as pd

# 读取Excel文件
file_path = '2024.5.13起每小时数据.xlsx'
df = pd.read_excel(file_path)

# 确保时间戳被正确解析
df['时间'] = pd.to_datetime(df['时间'], format='%Y/%m/%d %H:%M:%S', errors='coerce')

# 删除时间戳为空的行
df = df.dropna(subset=['时间'])

# 统计每小时进出港总次数
hourly_counts = df.groupby(pd.Grouper(key='时间', freq='H')).size().reset_index(name='进出港次数')

# 填补缺失的时间点，确保所有小时内都有数据（即使为0）
full_range = pd.date_range(start=hourly_counts['时间'].min(), end=hourly_counts['时间'].max(), freq='H')
hourly_counts = hourly_counts.set_index('时间').reindex(full_range).fillna(0).rename_axis('时间').reset_index()

# 将结果保存为新的Excel文件
output_file_path = '2024_5_13起每小时进出港统计.xlsx'
hourly_counts.to_excel(output_file_path, index=False)

print(f"统计数据已保存至: {output_file_path}")